ANNOVAR结果说明

您所在的位置:网站首页 splicing skip什么意思 ANNOVAR结果说明

ANNOVAR结果说明

2024-06-04 12:24| 来源: 网络整理| 查看: 265

一 结果文件说明

    1  VCF (Variant Call Format)是储存Variation结果的文件格式 该文件的#列为文件的详细解读信息

    2  *.hg19_multianno.xls是在VCF的基础上,用ANNOVAR注释,并增加OMIM、GO、KEGG等数据库功能注释信息。

二 结果文件(*.hg19_multianno.xls)按照功能区域注释基因及区域注释

变异位点所处的基因(对应的氨基酸)可能直接与疾病相关。公司对变异位点进行已知基因结构及所处区域注释,有助于老师了解此变异位点对应的基因结构及所处区域信息。

CHROM:染色体

POS:变异位点在染色体上的绝对位置

ID:dbSNP注释ID

REF:参考基因组碱基型

ALT:样本基因组碱基型

Func.refGene:对变异位点所在的区域进行注释(exonic,splicing, UTR5, UTR3, intronic, ncRNA_exonic, ncRNA_intronic, ncRNA_UTR3,ncRNA_UTR5, ncRNA _splicing, upstream, downstream,intergenic)。

说明:1、exonic应该包括coding exonic portion、UTR3和UTR5,但ANNOVAR注释结果中exonic只代表coding exonic portion。2、当一个变异位点位于多个基因或转录本,且功能不同,这些功能按照优先级排序,该列输出优先级最高的功能类型:Exonic = splicing > ncRNA> > UTR5/UTR3 > intron > upstream/downstream  > intergenic。当一个变异既位于一个基因的UTR3,又位于另一个基因的UTR5时,该列输出"UTR5,UTR3"。当一个变异既位于一个基因的downstream,又位于另一个基因的upstream时,该列输出"upstream,downstream "。

Gene.refGene:列出该变异位点相关的基因。

XXXlocalfreq:公司正常人外显子数据库中,该变异位点上突变碱基的等位基因频率;例如:0.32;表示假设数据库中1000人,其中320个人有该突变;

hgmd_variantType,hgmd_pmid:人类基因突变数据库注释,给出该变异位点相关的突变类型和在HGMD数据库中的ID

omim_id:孟德尔遗传病数据库注释,给出与变异位点所在基因相关的OMIM数据库ID

pho_or_dis,chpo_or_dis:给出与变异位点所在基因相关的遗传疾病中英文表型名称或疾病信息

inheritance:给出与变异位点所在基因相关的遗传方式

GeneDetail.refGene:描述UTR、splicing、ncRNA_splicing或intergenic区域的变异情况。当Func列的值为exonic、ncRNA_exonic、intronic、ncRNA_intronic、upstream、downstream、upstream;downstream、ncRNA_UTR3、ncRNA_UTR5时,该列为空;当Func列的值为exonic;splicing时,表示该位点位于某些转录本的exonic区,另一些转录本的splicing区,这种情况下,GeneDetail会给出该位点对于转录本splicing的影响,例如,NM_1524XX:exon3:c.232C>T,表示该变异位于转录本NM_1524XX上,exon3表示第3个外显子,c.232C>T表示cDNA的232bp处发生由C到T的突变;当Func列的值为intergenic时,该列格式为dist=1322;dist=12414,表示该变异位点距离两侧基因的距离

ExonicFunc.refGene:外显子区的SNV or InDel变异类型(SNV的变异类型包括synonymous_SNV, missense_SNV, stopgain,stopgloss和unknown;InDel的变异类型包括frameshift insertion, frameshift deletion, stopgain, stoploss, nonframeshift insertion, nonframeshift deletion和unknown)

AAChange.refGene:氨基酸改变,只有当Func列为exonic或exonic;splicing时,该列才有结果。按照每个转录本进行注释(例如,AIM1L:NM_001039775:exon2:c.C2768T:p.P923L,其中,AIM1L表示该变异所在的基因名称,NM_001039775表示该变异所在的转录本ID,exon2表示该变异位于转录本的第二个外显子上,c.C2768T表示该变异引起cDNA在第2768位上由C突变为T,p.P923L表示该变异引起蛋白序列在第923位上的氨基酸由Pro变为Leu),再如,FMN2:NM_020066:exon1:c.160_162del:p.54_54del,表示该变异引起cDNA的第160到162位发生删除,p.54_54del表示该变异引起蛋白序列在第54位上的氨基酸删除

*.wgEncodeGencodeBasicV19:Gencode对变异位点所在的区域进行注释(相关解释同*.refGene)

cpgIslandExt:CpG岛预测结果,注释结果为CpG岛名称,如CpG: 116(116是该CpG岛中CG二核苷酸的数目)

cytoband:该变异位点所处的染色体区段(利用Giemas染色观察得到的)。如果变异位点跨过多个区段,用短横线连接

wgRna:基于miRBase和snoRNABase,对变异位点相关的microRNA和snoRNA进行注释,给出microRNA和snoRNA的基因名称

targetScanS:UCSC提供TargetScanS注释数据库,库中包含在3’UTR中保守的microRNA结合位点,来源于TargetScanHuman5.1的预测结果;该软件预测microRNA的靶点,预测结果依据microRNA与靶点之间结合的效能进行排序,排名越靠前,说明microRNA与其靶点的结合越可能是实际存在的事件。此项给出microRNA靶点的信息,一是score,是该靶点的分值,反映的是结合效能的排名,因此,score越大,说明排名越靠后,实际发生该结合的可能性越小,作者没有推荐阈值;二是Name,是作用于该靶点的microRNA名称。例如,Score=62;Name=KRAS:miR-181:1,表示该靶点的分值是62,其位于KRAS基因的3’UTR中,受到该变异位点影响的microRNA是miR-181:1。表示该变异位点位于microRNA(miR-181:1)在基因KRAS的3’UTR上的结合位点。

tfbsConsSites:基于transfac矩阵数据库(v7.0),计算所有转录因子结合位点在人/小鼠/大鼠比对中的保守分值,当结合位点的分值达到阈值时,认为该位点在人/小鼠/大鼠中保守。该列给出的是该变异位点所在的保守转录因子结合位点的位置和分值,即Name和Score。Name是结合位点处的motif名称,这些motif能够被转录因子识别,例如V$CDPCR3_01,利用一些在线服务器(如MSigDB)能够查询这个motif能够被哪些转录因子识别;Score是该结合位点的保守分值

genomicSuperDups:检测该变异位点是否位于重复片段(segmental duplication)中。重复区域中检测到的遗传变异大多数是由于序列比对错误造成的,所以被注释到segmental duplications的变异需要谨慎对待,很可能是假阳性位点。给出两个值,一是Name,表示基因组中与该变异位点所在区域相似的片段的位置;二是Score,表示两个相似片段的序列一致性。例如,Score=0.994828;Name=chr19:60000,表示chr19:60000所在片段跟该变异位点所在片段相似,序列一致性为0.994828,范围0~1

rmsk:重复序列注释信息,重复序列来源于RepeatMasker注释。例如,Name="1385:(CACCC)n(Simple_repeat)"。Name由两部分构成,一部分(CACCC)n是repeat的名称,另一部分Simple是repeat的类别。只要有注释信息,就表明该变异位于散在重复序列或低复杂度序列中;这些区域容易出现比对错误,所以该区域的变异位点可靠性不高 保守(有害)性预测个体中的突变往往非常多(全基因组范围内能达到3.6M-4.4M),而真正有害的突变却是罕见的,有很多根据变异位点的保守性等信息进行有害性预测的软件能帮助我们进行突变位点的有害性评估。采用国际惯用的变异有害性预测软件对突变位点的有害性进行预测,协助找出真正有害的突变位点。

SIFT:SIFT分值(dbNSFP version 3.0),表示该变异对蛋白序列的影响。逗号前后分别是SIFT_score和SIFT_pred:SIFT_score是SIFT分值,分值越小越可能“有害”,表明该SNP导致蛋白结构或功能改变的可能性大。SIFT_pred是预测结果,取值为T或者D。当该变异同时影响多个蛋白序列时,对每条蛋白序列有一个SIFT值,取最小值。D: Deleterious (sift0.05))

Polyphen2_HVAR:利用PolyPhen2基于HumanVar数据库预测该变异对蛋白序列的影响,用于孟德尔遗传病的诊断(dbNSFP version 3.0)。逗号前后分别是Polyphen2_HVAR_score和Polyphen2_HVAR_pred:Polyphen2_HVAR_score是PolyPhen 2分值,数值越大越可能“有害”,表明该SNP导致蛋白结构或功能改变的可能性大;Polyphen2_HVAR_pred是预测结果,取值为D或P或B(D: Probably damaging (>=0.909), P: possibly damaging (0.447



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3